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BESCHREroUNG 

Voirichtung und Verfahren zum Unterdriicken von Echo, insbesondete bei Telefonen 

Die vorHegende Erfindung betrifft eine Vorrichtung md em entsprechendes Verfehien 
zum Unterdrucken von Echo fur eine Anordnung zum tfbertragen von Audiosignalen, 
5 insbesondere gpspiochener Sprache, wie beispielsweise Telefonen, mit: 

- einer Echoreduktianseinheit, die zwischen einem Eingangskanal zum Empfengen 
eines von einem femen Ende kommenden Eingang8-Audiosignals und einem 
Ausgangskanal zum Ausgeben eines Ausgangs-Audiosignals angeoidnet ist, zor 
UnterdiGckung eines in dem Ausgangs-Audiosignal enthaltenen Echosignals, 

10 - oner SprachaktivilStsdetektionsemheit zur Detektion eines in dem Eingangs- 
Audiosignal enlhaltenen Sprachsignals, und 

- einer Steuereinheit zur Einstellung eines Echounterdriickungsfektors der Echo- 
Unterdruckungseinheit fur die Unterdriickung von Echo. 

15 Jedes Telefon hat einen Lautsprecher und ein Mikrofim, die nicht voDstSndig voneinan- 
der akustisch entkoppelt sind, wodurch Echos entstehen konnen, die der feme Sprecher 
am femen Ende h5rt Dieses Problem tritt insbesondere bei Freisprecheinrichtungen, 
aber auch bei Mobilfunktelefonen und schnurlosen Telefonen aufgrand der geringen 
GehSusegtaBe und des lelativ gioBen Abstandes zwischen dem Mund des Sprecheis und 

20 dem Mikrofim au£ Um dieses sogpnamite akustische Echo zu venneiden, werden unter- 
schiedliche Ansatze oder Kombinationen davon benutzt Mittels eines Halb-Duplex- 
Schalters, der deegenigpn Sprecher dinipft, der mit leiserer Stimme spricht, konnen 
zwar Echos zuverlSssig unterdrackt werden, es besteht jedoch nicht die M5glichkeit, 
dass gleichzeitig in beiden Richtungen gesprochen wird (sogenanntes Voll-Duplex). 

25 Mittels einer Echoloscheinheit, die eine Schatzung des Echosignals von dem 

Mifctofonsignal subtrahiert, ist zwar erne Voll-Duplex-Kommunikation moglich, Echos 
weiden damit jedoch nicht immer vollstSndig unterdriickt. Eine weitere M5glichkeit ist 
ein Echounteidrucker, der das Ausgpngssignal in dem Mikrofoiq?fed nur dann dampfl, 
wenn Echos unteidrClckt werden mussen. 
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Aus der WO 99/35812 Al sind ein Verfehren und eine Vorachtung zur Steuenmg der 
Echounterdruckung in einem Kofmnnxdkationssystem bekaimt. la einer eisten Aus- 
gestaltung ist der akustische Echounterdrucker deaktiviei% wetin ein Spracihaktivitats- 
detektor anzdg^ dass das von dem femen Sprecher kommende Audiosignal keine 
5 Sprachkomponente enMIt In einer wdteren Ausgestaltung wild die Echounter- 
druckung nicht vollstandig deaktivierl^ sondem auf ein niedriges Unterdrudcungsniveau 
eingestell^ welches ausieichend ist, urn NachhaU zu unterdriidten. 

Bd dem bekanntra System wird also die Unterdruckung sofort zurQckgeschalte^ weaon 
10 das von dem femen Sprecher kommende Eingangs-Audiosignal keine Sptachsignal 
enthalt An&ngs konnen daibei aber noch Echos Munterwegs** sein wegen des Nachhalls. 
Der feme Sprecher kann also ein kutzes Echo hdien, nachdem er selbst aufhSrt zu 
sprechen oder audb nach sogenaonten Hosivlauten, vor allem nach den Lauten „t", ,4c" 
und „z". Daruber hinaus kann sich insbesondere beim Start des Systems, also bei 
1 5 Beginn eines Telefongesprachs, ein weiteres Problem ergeben, wemi, was haufig der 
Fall ist, die Echoreduktionseinheit (echo reduction xmit) eine sogenannte 
Echokonq>ensationseinheit (echo cancelling unit) mit ad^tivem EIR-Filler (finite 
impulse response filter) aufweist Bei Beginn des Telefongesprachs ist ein solches Filter 
nSmlich noch nicht adaptier^ und es wird keine Echokompensation eizielt Die 
20 Echoreduktion eines solchen FIR-Filters steigt eist langsam an und kann nur bei femer 
Sprache adaptieren. Dies hat zur Folge, dass am Anfeng noch Echos dmchkommen und 
dass erst nach einer Zeit von einer halben bis emer Sekunde die Echounterdruckung 
(echo suppression) vollstSndig wirkt. 

25 Der vorhegenden Erfindung Hegt deshalb die Aufgabe zugnmde, eine Vorrichtung und 
ein entsprechendes Verfahren zur wirksamen Unterdruckung von Echos bei einer 
Audioiajertragungsvonichtung, insbesondere einem Telefon, vorzusehen, wobei die 
oben beschriebenen Probleme vermieden werden sollen, bei dem also insbesondere 
dann, wenn das von einem femen Ende kommende Eingangs-Audiosignal fcein 

30 Sprachsignal enthalt, wiiksam und schnell Echos imteidruckt werden. 
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Diese Aufgabe wird erjBndungsgemafl dutch eine Voirichtimg gemSB Anspruch 1 
gelost, die dadmch gekeimzeiclmet ist, dass die Steuereinheit detart ausgebildet ist, dass 
der Echounterdruckungsfektor von einem wahiend des Vorliegens eines Sprachsignals 
5 in dem Eingangs-Audiosignal eingestellten hohen Echounteidruckungswert 

schrittweise und kontinuieriich auf einen niedrigen Echounterdmckungswert reduziert 
wird, wenn von der Sprachaktivitatsdetektionseinheit detektiert wird, dass das 
Eingangs-AudiosigDal kein Sfnachsignal enfhalt 

10 Ein entsptechendes Verfehien zur Echoieduktion ist in Anspruch 1 1 angegeben. Ein 
Con5)uteiprograinm zur finplementieiung des Verfehiens ist in Anspruch 12 angeben. 
Vorteilhafte Ausgpstaltungen der Erfindung sind in den Unteranspruchen angegeben. 

Der Erfindung Uegt die Erkenntnis zugrunde, den EchounterdrQckungsfektor nicht 
15 abrupt voUstSndig auf NuU oder einen niedrigen Wert herunterzuschalten, wenn das 
Eingangs-Audiosignal kein Sprachsignal enthjflt, sondem stufenweise und 
kontinuierUch, da ansonsten Echos aofgnind von Nachhall iiberttagen werden, wenn der 
feme Sprecher aufhSrt zu sprechen oder insbesondere auch nach sogenannten 
Plosivlauten. Derart stoiende Echos werden bei der erfindungsgemSBen Vonichtung 
20 veimieden, da der Echounterdriickungsfektor in dem Moment, wo der feme Sprecher 
aufhort zu sprechen, oder nach einem Plosivlaut, nachdem insbesondere an Wortenden 
eine kurze Pause kommt, erst aUmahUch abgesenkt wird und nicht abrupt wie bei der 
bekannten Votrichtung. Zu diesem Zeitpunkt werden Echos also noch ausreichend staric 
unterdruckt, um bei dem femen Sprecher kemen NachhaU ankmnmen zu lassen. Dies 
25 fOhrt zu emer wesentlich angpnehmeren Sprachiibertragung bei der erfindungsgemaBen 
Vorrichtung. 

In einer bevorzugten Ausgestaltung ist vorgesehen, das AbkBngen von dem hohen 
Echounterdruckungswert auf den niedrigen Echounteidruckungswert mittels einer 
30 e3q)onentieUenI^mktionzusteuern.DiesbildetinetwadenwahrBnZatverM 

Echoenergie nach, da diese bekaontlich auch exponentieU mit der Zdt abnimmt, und 
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fiihrt somit zu dner optimalen Echountetdiuckuiig in den genannten Zei^iunkten. 

Eine bevorzugte Funktion ffir die Steuerung des Echounterdrfickungsfektois in den 
genannten Zra^uokten ist in Anspnich 3 angegeben. 

5 

In einer weiteren Ausgestallung ist vorgesehen, das Zuruckschalten des Echounter- 
driickungsfektors um eine bestimmte Totzeit zu verzSgem, also noch wSbrend dieser 
Totzeit den hohen Echounterdruckungswert eingestellt zu lassen und erst danach den 
Echounterdr&damgsMlQr abzusenken. Auch dadnrch kaon Nachhall wirlsam 
10 unterdrQcktwerden. AUetdings ist eine derartboheE(^ounteidri^ 

Totzeit nicht zwingend erfoiderlich und ttSgt nur zu einer unn5tigen Veischlechtening 
der Obeitragungsqualitat des von dem nahen Ende (bzw. dem nahen Sprecher) 
kommenden Audiosignals, insbesondere eines Sprachsignals, bei. 

15 In einer Weiterbildung ist eine weitere Sprachaktivitatsdetektionseinheit voigesehen zur 
Detektion, ob das von dem nahen Ende kommende Audiosigoal ein Sprachsignal des 
nahen Sprechers enthMlt In diesem Fall ist die Steuereinheit so ausgebildet, dass sie bd 
Vorliegen von Sprachsignalen sowohl in dem Eingangs-Audiosignal als auch in dem 
von dem nahen Bide kommenden Audiosignal einen mittleten Echounterdrackungswert 

20 einstelll^ wahrend nur bd Nichtvoihandensein eines Sprachsignals in dem Eingangs- 
Audiosignal der maximale Echounterdriickungswert dngestellt wird. Im eisten Falle 
werden zwar Echos nicht voUstandig unterdruckt; das von dem nahen Ende kommende 
Sprachsignal wird aber doch hdrbar, gegebenenfells verzerr^ iibertragen. 

25 Bevorzugt wird bei der erfindungsgemaBen Vorrichtung eine Echoreduktionseinhdt 
verwendet, die ein ad^tives FIR-Filter aufiveist zur Eizeugung einer Schitzung des in 
dem von dem nahen Ende kommenden Audiosignal enthaltenen Echos des Eingangs- 
Audiosignals. Ein solohes FIR-Filter wild haufig auch in dner 
Ediokompensationseinhdt verwendet, die das von dem nahen Ende kommende Signal 

30 nicht verandert Die genannte Schatzung wird im Allgemeinen von dem von dem nahen 
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Ende kommende Audiosignal sublrahiert, bevor das von dem nahen Ende konmende 
Audiosignal, an das feme Ende iiberttagen wird. Die Leistung dieser EchoschStzung 
dient zusatzUch auch als Eingangssignal fOr eine dem FIR-Filter nachgeschaltete 
Echounterdtuckungseinheit. Insbesondere beim Start der Komnmnikation, also bdm 
Beginn eines Telefongesprachs, ist ein solches ad^tives FIR-FUter jedoch noch nicht 
adaptiert und die Echounterdnickungseinheit wird niit einer zu geringen Schatzung der 
Echoleistung gespeist, was eine zu geringe Echounterdruckung zur Folge hat. 
ErfindungsgpmaB ist deshalb in einer vorteilhaften Ausgpstaltung vorgesehen, dass die 
Koeffizienten des FIR-Filters beim Start einer Kommunikation imgleich NuU 
initialisiert weiden, vmi eine lealistische Leistung im Schatzsignal zu erreicben, 
wodurch eine ausreichende Echounterdruckung auch in der Star^hase erreicht wird. 

Eine weitere, davon ausgehende Ausgestaltung sieht vor, in der Startphase den 
Echounterdriickungsfektor entsprechend dem anfingUch schlechten Adaptionszustand 
des FIR-Filters zu erhohen, um die zu geringe Echokompensation in der Startphase 
auszu^eichen. Erst aUmShUch wird dann, beispielsweise mittels einer Zeitsteuerung, 
der Echounlerdrucknngsfektor auf einen statischen hohen Echounterdriickungswert 
abgeseokt, der dann beibehalten bleibt, solangp in dem Eingangs-Andiosignal ein 
Sprachsignal enthalten ist Beispielhafk kann die Zeitsteuerung so ausgestaltet sein, dass 
die Absenknng auf den statischen hohen Echounterdruckungswert nach etwa 0,5 bis 1 
Sekunde, vorzugsweise nach etwa 0,8 Sekunden, erreicht ist. Dadurch werden in der 
Starlphase, also am Anfeng eines Telefongesprachs, Echos mit absoluter Sicherheit 
vermieden. Wahrend dieser Zeit ist die Vollduplex-Fahigkeit, also die Fahigkeit, dass 
der feme Sprecher hort, wenn ihn der nahe Sprecher unterbrechen will oder eine kmze 
Bemericung macht, wiihrend der feme Sprecher aktiv ist, vom nahen zum femen 
Sprecher bin zwar eingeschtankL Dies ist im Allgqmeinen jedoch kein Nachteil, da in 
den ersten Sekunden eines Tdefonats selten Gegensprechen stattfindet, da 
ubHcherweise jeder Teilnehmer zunSchst seinen Namen oder dnen GruB iaieimittelt 

> Beispielhafte Werte fur die gpnannten Echounterdruckungswerte sind in weiteren 
UnteransprQchen angegeben. 
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Die Eifindung wild nachfolgend anfaand der Zdchnungen nSher erlSutert Es zeigen: 
Fig. 1 ein BlodcschaMbild einer erfindungsgemaBen Echoreduktionsvomchtung, 
Fig. 2 Zeitverlanjfe des EchounterdrQckungsMtors und der erzielten 
5 Echovmterdriickung bei der erfindungsgemaBeii Voirichtung und 

Fig. 3 ein Blockschalfbild einer erfinHiitigsgi pTnaR ^yi verwendeten 
Spiachaktivitatsdetektionseinheit 

Fig. 1 zeigt als Blockschaltbild eine erlBndungsgemaBe Echoieduktionsvonichtimg. 

10 Diese ist in der gpzeigten Ausfuhrung bei einer Anordnung zur Oberttagung von 
Audiosignalen, also beispielsweise bei einem Mobilftmktelefon, einer Fieisprechein- 
lichtung, einem Fimlqgerat oder einem drahtlosen Telefim, eingesetzt Dabei wird ein 
von einem femen Bide (femen Sprecher) auf einem Eingangskanal 1 kommendes 
Eingangs-Audiosignal Al von einem Wandler 2, welcher einen Verstarker 21, einen 

15 Digital-Analog-Wandler 22 und einen Lautsprecher 23 aufweist, verstark^ in ein 
analoges elektrisches Signal gewandelt und an dem Lautsprecher 23 ausgegeben. Ein 
von einem nahen Bode (nahen Sprecher) kommendes Audiosignal AO, das sowohl 
Sprache als auch Rauschen enlhalten kann, wird an einem RGckwandler 3, der ein 
Mikiofim 3 1, einen Analog-Digital-Wandler 32 und einen Verstarker 33 aufweist, 
20 gegebenenfells zusammen mit einem Echosignal Al ' des Eiogangs-Audiosignals Al, in 
em digitales elektrisches Signal gewandelt und verstark^ bevor es nach einer 
entsprechenden Nachveiaibeitung zur Echounterdruckung in der Echoreduktionseinheit 
4 an dem Ausgangskanal 5 als Ausgangs-Audiosignal A2 zur Obertragung an das feme 
Ende (den femen Sprecher) ausgegeben wild. 

25 

Die erfindungsgemaBe voigesehene Echoreduktionsemheit 4 weist ein adaptives FIR- 
Filter (Finite-Impulsantwort-Filter) 40, das auch als Echokompensationseinheit 
bezdchnet werden kann, auf, das eine Schatzung e des in dem Ausgangssignal z des 
Rucfcwandlers 3 enthaltenen Echos des Eingangs-Ausgangssignals Al erzeugt. Dieses 
30 Schaizsignal e wird zum emen von dem Ausgangssignal z des RQckwandlers 3 mittels 
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eines Siibtrahierera 41 subtrahiert Dabei kBimeii jedoch lestUche Echos in dem 
Ausgsngssignal r des Subtrahiereis 41 veatoleiben, emerseits wegen einer Fehljustierung 
des FIR-Fflteis 40 und andererseits, da das FIR-Filter 40 niir eine finite Echodauer von 
etwa 25 Millisekunden abscMtzen kann. 

5 

Das echoreduzierte Ausgangssignal r des SubtraMerers 41 wird nachfolgend einer 
Nachveraibeitangseinlieit 42, die aucli als Echounterdriickungseinlieit bezeichnet 
weiden kann, zugefiihrt, die zunachst das Signal r mittels einer FFT-Einheit 421 , 
insbesondeie mit 128 Punkten, in den Frequenzratun transfonniert. Resliiche Echos 

10 weiden dann unterdriickt indem Frequenzen mit dominanten Echobeitiagsa gedampft 
wetden. Frequenzen, bei denen das von dem nahen Ende kiommende Audiosignal AO 
dominiert, weiden dagegen weniger gedampft Diese Dampfung erfolgt in dem 
MuUplizierer 422 mittels einer firequenzabhangigen Dampftmgsfunktion D, die mittels 
einer Dampftmgsberechnungseinlieit 423, die vorzugsweise das Verfehien des mitfleren 

15 FeMerquadmts (Minimum Mean Square EiiorMMSE)verwendet.Dazuistein 
ftequenzabhangigps Echoschatzsignal E erforderUch, das aus dem zeitabhangigen 
Echoschatzsignal e dutch FFT-Transfoimadon mittels einer zu der FFT- 
Transfoimationseinheit 421 gleichwiikenden FFT-Tiansfoimationseinheit 424 
beiedmet wird. Da das zeitabhangige Echoschatzsignal e nur die firiihen Echos, 

20 beispielsweiseinnerhalbderersten25^fflllisdcunden,enthat,istauBerdemeMie 
Echoreflexionseinheit 425 (echo reverberation) vorgesehen, die eine SchStzung der 
spateren Echos unter Annahme eines exponentiellen Abfells der Echoenergie hinzufOgt. 

Die Stirke der Echounterdruckung wird mittels eines Echounteidnickungsfektors s 
25 gesteuert, mit dem das ftequenzabh§ngige Echoschatzsignal E in dem Multiplizierer 
426 mult5)liziert wird. Eine Spiachaktivitatsdetektionsemheit 427, die aus dem in den 
FiequenAereich transfoimierten Ausgangssignal r des Subtrahiereis 41 und dem in den 
Fiequenzbereich tiansfbrmierten Echoschatzsignal e detektiert, 6b m dem von den 
nahen Ende kommenden Audiosignal AO ein Spiachsignal enthalten ist, gibt eine 
30 entspiechende Information an eine Steueieinheit 6 weiter. AuBerdem wird der 
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Steuereinheit 6 erne von einer wdteten SprachaktivitStsdetektionseinheit 7 emuttelte 
iQfomiation zug»ahrt, ob in dem Eingangs-Audiosignal Al ein Sprachsignal enHialten 
ist. Aus diesen lofotmationen, und optional dner weiteren Zeitinfonnation aus einer 
Zeitsteuereinheit 8, wild dann nach dem erfindungsgemaSen Verfehren der je nach 
5 Situation geeignete Echounteidruckungsfektor s beiechnet, wie nachfolgend edautert 
werden soU. Nachdem das in den Frequenzbereich transfoimierte Ausgangssignal r des 
Subtrahierers 41 mit der entsprechend betechneten Dampfung D multipliziert wuide, 
wird es wieder in den Zeifbereicb mittels einer inveisen FFT-Transfonnationseinlieit 
428 ttansformierti wonach es dann an das feme Ende fiber den Ausgangskanal 5 als 
10 Ausgangs-Audiosignal A2 fibertiagen wild. 

Die Erfindung nutzt den psycho-akustischen Eflfekt aus, dass ein menschlicher Zuhorer 
stationaie Signale nicht als Echosignale empfindet. Eine einfeche ErMarung dafiir ist, 
dass das „Ecliosignal" von Hmtergrundrauschen, welches vom femen Ende her kommt, 
wie das Rauschen selbst klingt, da die spektralen Anteile von Rauschen sich 
noimalerweise bei der Ruckkopplung von dem Lautsprecher 23 zu dem Mikiofon 31 
nicht verandem. Dadurch wird ein derartiges ^ho" von dem Hintergnmdiauschen 
maskiert und ist somit nicht horbar. AuBerdem klingt JSxiho" von EHntergnmdrauschen, 
das von dem femen Ende her kommt, wie Rauschen, das von irgendwo anders her 
kommt, z. B. von dem nahen Ende. Ein H6rer am femen Ende diirite deshalb ein 
solches ,3cho" nicht wirUich als Echo ansehen, auch wenn er es h5ren konnte. Die 
Echounlerdiiickung kann deshalb in Zeitpunkten, in denen nur Hintergrundrauschen in 
dem von dem femen Ende kommenden Eingangs-Audiosignal Al enthalten ist, stark 
reduziert werden, ohne dass Echos von dem am femen Ende befindUchen Teihiehmer 
wahrgenommen werden. 

ErfindungsgemaB reduziert deshalb die Steuereinheit 6 den Echounterdriickungsfeklor s 
auf einen kleinen Wert siow in solchen Situationen. Diese Reduzienmg wird 
erfindungsgemaB jedoch nicht ahn5>t, sondem schrittweise und kontinuierKch 
30 vorgenommen, insbesondere entsprechend dem Abfell der Echoenergie. Ansonsten 
wOide ein AbfeUen des Echos horbar sein, wenn der am femen Ende befindHche 
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Sprecher aufhSrt zu sprechen. Die Steuereinheit 6 verwertet dabei, wie olieii berdts 
angedeutet, die vcm den Spradiaktivitatsdektektioiisejiiheiten 427 und 7 erhaltenen 
Infomiationen dariiber, ob das der Nachverarbeitungseiiiheit 42 zugeffihrte Signal r 
bzw. das Eingangs-Audiosignal Al ein Sprachsignal enlJialt. Das Verhalten, abhSngig 
von dieser Monnation, ist in der nachfolgenden TabeUe zusammengestellt, wobei k die 
Rahmenzeit (frame time) ist und a den exponentieU verlaufenden Abfell der 
Echoenergie iwiedeigibt 



Al = Sprachsignal 


AO Sprachsignal 


Echounterdriickungsfektor s 


Nein 




s [k] =a • s [k- 1] + (1 - a) • Siow 


Ja 


Ja 


S pc] = Sdoable 


Ja 


Nein 


S pc] = Sfai^ 



10 Echowiedergabeeinheit 425 zur Echoabschatzung verwendet Bevotzugt weist der 
Faktor a einen Wert im Bereich von 0,5 vmd 0,99, vorzugsweise im Bereich von 0,75 
bis 0,85, auf. Bei einer lypischen Rahmenzeit k von beispielsweise 0,01 Sekunden ist 
ein Wert von of=0,8 vorteilhaft. AUgemein kann der Faktor a auch beschrieben wetden 
mit a = 10^-3*Rahmenzeit / T«) ), wobei Teo die Nachhallzeit eines typischen Raumes 

1 5 (z3. dnes Buros, Wohnzimmers, Autos) ist 

Durcb die erfindungsgemSBe Steuerung wird eine deutlich verbesserte SprachquaHtat 
der von dem nahen Ende an das feme Ende fibertragenen Sprache eneicht, wobei fur die 
Bestimmung des Echounterdriickungsfiktors bei fehlendem Sprachsignal in dem 
20 Eingangs-Audiosignal das VorUegen eines Sptachsignals in dem von dem nahen Ende 
kommenden Audiosignal nicht von Bedeutung ist. Da das VorHegen eines 
Sprachsignals in dem Eingangs-Audiosignal mit hoher Zuverlassigjceit mittels der 
Spradwktivitatsdetektionseinheit 7 bestimmt werden kann, konnen vedialtnismaBig 
Memo Werte far den EchountetdrOckungsfektor bei fehlendem Sprachsignal in dem 
25 Eingangs-Audiosignal eingestellt wetden, die beispielsweise 0,5 oder weniger betragen, 
ohne das Risiko eingehen zu mussen, dass Echos filscWicherweise nicht unterdruckt 
weiden, was ebenfells zu emer hohen tJbertiagangsquaKtat eines von dem nahen Ende 
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kommenden Sprachsignals beitragt. Auch wenn beide Sptecher gleichzeitig sprechen, 
kaim die tlbertragung des Sprachsignals vom nahen Sprecher verbessert werden, da die 
Sprachaktivitatsdetektioiiseiiiheit 7 das Umschalten aa£dea niedrigen 
EchounterdrOckungsfektor Sbw wahrend kuizer Pausen, sogar innerhalb eines 
5 gesprochenen Wortes, der von dem femen Ende kommenden Sprache erfolgen kann. 

Das Zuruckschalten aaf den niedrigen Echounteidruckungswert su>„ konnte auch urn 
eine Totzeit verzogert werden, was aber wahrend der gesamten Totzeit, die 
beispielsweise 0,4 Sekunden betragen konnte, unnotighohe, weil gleichbleibende 
10 Unterdriickung bewirkt Besser ist deshalb das oben beschriebene exponentieUe 
Abklingen von dem hohen Echounterdriickungswert sm^ auf den niedrigen 
Echounterdiuckungswert Sbw Dies bildet im wesenflichen den wahren Zeitverlauf der 
Echoenetgie nach, da diese auch exponentiell mit der Zeit abninunt 

15 Bei Verwendung eines ad^ven FTR-FiMers 40, wie es vorKegend bevoizugt eingesetzt 
wird, wurde fesfgesteUt, dass insbesondere beim Start der Kommunikationsubertragun& 
also beim Beginn eines TelefongesfprSchs, das FIR-Filter 40 noch nicht ad^tiert ist und 
deshalb fceine Echoreduktion vom Signal r nach z erzielt wiid. Die Echoreduktion des 
FIR-Filters steigt erst langsam an, so dass zu Beginn noch Echos durchkommen, wenn 

20 die Nachveraibeitungsvorrichtung 42 noch in normaler Art und Weise unterdruckt Dies 
kann noch dadurch verscharft werden, dass die Nachverarbeitungsvotrichtung 42 Echos 
proportional zur Leistung des Echosch§tzsignals e unterdruckt Wenn das FIR-Filter 40 
also wie ubHch mit NuU-Koeffizienten initialisiert wird, ist diese Leistung zunachst 0 
und erreicht fiuhestens nach einer Wartezeit von etwa einer halben Sekunde den wahren 

25 Wert der Echoleistung. 

Um dieses Problem auszugleichen wird erGndungsgemSB deshalb fur ausieichend 
Leistung des Echoschalzsignals e wahrend der Star^hase gesorg^ indem die 
KoefiBzienten des FIR-Filters 40 ungleich Null initialisiert werdea Beispielsweise kann 
30 ein Koeffizient gleich 1 gesetzt werden. Bei der Echoreduktionsehiheit 4 der vorHegend 
verwendeten Art ist der Wertebereich der KoefiBzienten auf -1 bis +1 beschrankt, so 
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dass mehiere KoefiSzienten vorbesetzt werden mflssen, urn eme tealistische Leistung im 
Echoschatzsignal e beim Start zu enrachen. Dabei ist zu beachten, dass die 
Koeffizienten ein breilbandiges System leprSsentieien, damit die 
Nachverafbeitungseinlieit 42 auch Echos bei alien Fiequenzen unterdiacken kann. 
Geeignet ist beispielsweise ein Vorbesetzen von acht aufeinanderfolgenden 
Koeffizienten desFIR-Filters mitden Werten {1, 1, 1, 1, -1, -1, 1, -1}. Somit erhalt man 
beim Start eine 8-fiiche Leistung des Echoschatzsignals e im Vergleicli zum 
Vorbesetzen eines einzelnen Koeffizienten. Zudem iibertragt ein so votbesetztes FIR- 
Filter alle relevanten Frequenzen etwa in gleidier Weise. 
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Bei einer bevorzugten Ausgestaltung der erfindungsgpmaBen Vonichtung erfolgt 
deshalb zusatzlich eine Echounlerdruckang durdi die Nachverarbeitungsvoirichtung 42 
beim Start. Die Idee ist dabei, den hohen Echounterdruckungswert Sut^ entsprechend 
dem anjSnglicli schlechten FIR-Adaptionszustand zu erhohen. Dazu kann 
15 beispielsweise die gezeigte Zeitsteuereinrichtung 8 verwendet werden. Der Wert des 
niedrigen Echounlerdracknngswertes, also von siow, wird beibehalten, da ohne feme 
Spracbe auch beim Start kdne Echos entsteben. 

Fig. 2 zeigt den Verlauf des Echounterdruckungsfiaktors s, wobei der Verlauf des hohen 
20 Echounterdriickungswertes Sbigii gestrichelt dargestellt ist Im Bereich A ist die 
Unterdruckung gtoB genug, um die zu geringe EchokDnq)ensation des FIR-Filters 
auszugleichen. hi den Bereichen B und C findet keine FIR-Ad^on wegen fehlender 
Spracbe im Eingangs-Audiosignal statt, was durch das Ausgangssignal FE-SAD der 
Sprachaktivitatsdetektionseinheit 7 angezeigt wild, Deshalb wird der hohe 
25 Echounterdrudcungswert sug^ in den Bereichen B und C nicht weiler verldeinert; die 
Zeitsteuereinheit 8, die beispielsweise als Anfengszeilzahler ausgestaltet sein kann, 
zShlt somit nicht weiter. AuBerdem ist die Zeitsteuereinheit 8 bevorzugt so eingestellt, 
dass sich noch ein Sicherheitsbereich D eigibt, da die Adaptionsdauer abhSngig von der 
femen Spracbe schwanfcen kann. Ab dem Berdch E ist der stationSre Zustand eneicht, 
30 und Sii^= ShigMatbleibtkonstant auf dem stationSren hohen Echounterdrficknngswert. 
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Erkennbar ist in Fig. 2 auch der in den Bereichen B und C, also bei feWender Spiache 
im Eingangs-Audiosignal, erfindungsgemaB vorgesehene ejqwnentielle Abfell des 
Echounterdriickimgsfektois s auf den niedrigen Echounterdriickungswert siow- Des 
weiteren ist in Fig, 2 in dem untersten Diagraaim der Verlauf der Echoreduktion ER 
fiber der Zeit erkennbar. Wie ersichflich ist nach etwa 0,8 Sekunden Adaptionszeit die 
erforderliche Genaui^eit sicher erreicbt (bei einem vorliegend vecwendeten FIR-FiltCT 
mit 200 KoefBzienten). Bei gegebener FIR-Filterlange ist also die Konvetgenzzeit 
befcannt Wt s<4 leagiert die Nachverarbeitungseinheit 42 auch auf geringe Echos mit 
MaximalunlerdrQcknng. Jn diesem Fall vethSlt sie sich wie eine ftequenzabhSngige 
Halbdi5)lex-Steuerung in Sendeiichtung, d. h. es kommen keine Echos dutch, aber 
wahrend femer Spiache ist auch die Sendeiichtung gesperrt Mit swgiMnh = 10 ist dies in 
den Bereichen A der Fall, hi Bereich B wird die Unterdriickung entsprechend dem 
Nachhall exponentieU vermindert, und im Bereich C ist mit sw = 0,5 die Sendeiichtung 
fireigeschaltet. Ab dem Bereich E wird mit Shig.stat = 1,5 nur noch die Unterdriickung von 
Restechos, die nicht vom FIR-Filter kompensiert wuiden, eneicht, dafur aber die 
Senderichtung nie ganz gespetrt, d. h. das Nomialverhalten nach der hiitialisierungs- 
phase ist eireicht 

Ein Blockschaltbild einer beispielhaften Sprachaktivitatsdetktionseinheit, wie sie 
erfindungsgemfiB verwendet wird, ist m Figur 3 gezeigt Eine derartige Emheit kann em 
Sptachsignal innerhalb ernes Signal mit stationaiem Hmtergrundrauschen detektieren. 
Diese weist in der gezeigten AusfOhiungsfoim eme Emheit 71 zur Bestimmung des 
fiber einen kurzen Zeittaum gemessen Signalpegels 1^, eine Einheit 72 zur Bestinnnung 
des fiber emen langeren Zeitcaum gemessenCTi minimalen Signalpegels Mi des 
Eingangssignals I sowie einen Komparator 73 auf, Dabei wird ausgenutzt, dass ein 
Sprachsignal einen stark zeitabhangigen Signalpegel im Veigleich zu einem 
Hinteigrundrauschsignal aul^^eist, Immer wenn der fiber einen kuizen Zeittaum 
gemessene Signaj^egel U um einen Faktor C, bdspielsweise C = 2 (was 6 dB 
entspricht) gtfiBer ist als der minimale fiber einen l§ngeren Zeittaum (z. B. 2 Sekunden) 
gemessene Signalpegel Mi ist, wild Spiachaktivitat detektiert und ein entsprechendes 
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Ausgangpsignal O mil dieser InfiMmation ausgpgeben. 

Sowohl das vorzugsweise exponentieUe Abklingen von su^ nach Sum, als auch die 
Steuenmg von SMgh beim Start erlauben es , die Unterdruckung so gering wie mSgUch zu 

5 halten, aber dennoch alle Echos zu entfemen. Je geringer die Unterdruckung ist, desto 
besser ist die VoUdiq)lex-Kommunikation bei Gegensprechen (double-talk). 
Volldiqilex-Kommunikation heiBt hier, dass der feme Sprecher hort, wenn ihn der nahe 
Sprecher unterbrechen will oder eine kmze Bemerknng macht, wahrend der feme 
Sprecher aktiv ist Kn weilerer VorteU der erfindungsgpmSBen Steuenmg von swgh beim 

10 Start ist, dass am AnfeiigemesTelefongeq?rSchsEdM)smitatosol^^ 

vemiieden wenien. Wahrend dieser Zeit ist die Vollduplex-F3hi^ vom nahen zum 
femen Sprecher hin zwar eingeschrankt, was aber kein Nachteil ist, da in den ersten 
Sekunden eines Telefonats sehen Gegensprechen stattfindet, sondem jeder Teihiehmer 
zunachst seinen Namen odei einen GruB aussipricht 

15 
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patentansprOche 



1 . Votrichtimg zur Redukdon von Echo fur erne ABOfdnung zum OberHagen von 
Audiosignalen, insbesondere von gesprocheaer Spiache, mit 

- einer Echoreduktionseinlieit (4), die zwischen einem Eingangskanal (1) zum 
Empfengen eines von einem femen Ende kommenden Eingangs-Audiosignals (Al) 

5 und einem Ausgangskanal (5) zum Ausgeben eines Ausgangs-Audiosignals (A2) 
angeordnet ist, zur Unterdnickung eines in dem Ausgangs-Audiosignal (A2) 
enthaltenen Echosignals, 

- einer Sprachaktivitatsdetektionseinheit (7) zur Detektion eines in dem Eingangs- 
Audiosignal (Al) enthaltenen Sprachsignals, und 

10 - einer Steuetdnheit (6) zur Einstellung eines Echounteidruckungsfektors (s) der 
Echoieduktionseinheit (4) fur die Unterdruckung von Echo, 
daduich geke" T>7:ftif!litiet- 

dass die Steuereinheit (6) derart ausgebildet ist, dass der Echounterdruckungsfektor (s) 
von einem wahrend des VorUegens eines Sprachsignals in dem Eingangs-Audiosignal 
15 (Al) eingestellten hohen Echounterdriickungswert schrittweise und kontinuierlich auf 
einen niedrigen Echounterdriickungswert reduziert wird, wenn von der Sprachaktivitats- 
detektionsemheit (7) detektiert wird, dass das Eingangs-Audiosignal (Al) kein 
Spracteignal emhSlt 

20 2. Vorrichtung nach Anspruch 1, 

HaHnmli pw1mnti9: eichnet 

dass die Steuereinhdt (6) derart ausgebildet ist, dass die Seduzierung des 
Echounterdriickungsfektors (s) von dem hohen Echounterdriickungswert auf den 
niedrigen Echounterdruckungswert exponentiell erfolgt 
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3. Vorrichtimg nach Anspruch 2, 

dadurch g ekennzetr.Tinet^ 

dass die Reduzienmg des Echoimterdriickungsfaktors (s) entsprechend der Funktion 
s[k] = a • s[k~ 1] + (1 - a) • siow erfolgt, wobei sM der Echounteidruclamggwert zim 
Zeitpunkt k, a em das exponentielle Reduzieningsverhalten leprasenlierender Faktor 
und Slaw der xninimale Echo-Unterdruckungswert sind 

4. Vorrichtung nach Anspruch 3, 

dadurch p pkenmG\rhnPit^ 

dass der iniiiiinale Unterdruckungswert siow einen Wert im Bereich von 0,1 bis 1, 
vorzugsweise von etwa 0,5, und der die exponentielle Reduzierung reprasentierende 
Faktor a einen Wert im Bereich von 0,5 und 0,99, vorzugsweise im Bereich von 0,75 
bis 0,85, aufweist 

5. Vorrichtung nach Ansprach 1, 

dadurch g elrennsTftirliTipt, 

dass die Steuereinheit (6) ausgebildet ist zur zeitlichen Verzogerung der Reduzierung 
des Echounterdriickungsfaktors (s) von dem eingestellten hohen Echounterdriickungs- 
wert auf den niedrigen Echounterdruckungswert um eine Totzeit, insbesondere im 
Bereich von 0,1 bis 1 Sekunde, vorzugsweise von etwa 0,4 Sekunden. 

6. Vorrichtung nach Anspmch 1, 
dadurch gekennzeichnet 

dass eine zweite Sprachaktivitatsdetektionseinheit (427) zur Detektion eines in dem der 
Echoreduktionseinheit (4) zu^fuhrten echoreduzierten Audiosignal (r) enthaltenen, von 
einem nahen Ende kommenden Sprachsignals vorgesehen ist und dass die Steuereinheit 
(6) derart ausgebildet is^ dass der Echounterdruckungsfaktor (s) auf den hohen 
Echoimterdruckungswert eingestellt wird, wemi das Eingangs-Audiosignal ein 
Sprachsignal und das echoreduzierte Audiosignal (r) kein von dem nahen Ende 
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kommendes Sptachsignal enthalten, und dass der Echounterdruckungsfektor (s) auf 
emen mitfleren, zwischen dem hohen und dem niedrigen Echomterdruckungswert 
Kegenden Echountetdruckmigswert emgesteUt wird, wenn das Emgangs-Audiosignal 
(Al) ein Sprachsignal und das echareduzierte Audiosignal (r) ein von dem nahen Bide 
5 kommendes Sptachsignal enthalten. 

7. Varrichtung nach Anspruch 1, 
flftdurch eekennzeichnet 

dass die Echoreduktionseinheit (4) ein ad^tives FIR-Echofilter (40) aufweist zur 
10 BestimmungeinesEchoschatzsignals(e) und dass die Koeffizientendesad^tivenFIR- 

Echofilteis (40) bdm Start des Empfengs des Eingangs-Audiosignals (Al) auf einen 
Wert ungleich von Null initialisiert werden. 

8. Vomchtung nach Anspruch 7, 
15 dadurch p *^V<^ti7:ftir,Tinet, 

dass die Steuereinheit derart (6) ausgebildet ist, dass der Echounterdiuckungsfektor (s) 
beim Start des Empfangs des Eingangs-Audiosignals (Al) auf einen maximalen Start- 
Echounterdriickungswert eingestellt wirdund danach kontinuierlich, insbesondete 
linear, wiihrenddes Vorhandenseins eines Sprachsignals in dem Eingangs-Audiosignal 
20 (Al) auf einen stationSren hohen Echo-Unterdriickungswert leduziert wild. 

9. Votrichtung nach An^prach 8, 
HaHiwTi p;p.VftniireichneL 

dass die Zeitdauer fur die Reduzierung des Echounterdriickungsfiktars (s) von dem 
25 maximalen Start-Echounterdruckungswert auf den statischen hohen Echounter- 

druckungswert so eingestellt ist, dass sie in etwa der Ad^tionsdauer des ad^tiven FIR- 
Echofilters (40) entspiicht 



-17- 



PHDE03O0O8 EP-P 



10. Vorrichtung nach Aospmch 9, 
dadiirch p pTcenti7:eichnat , 

dass der maximale Start-Echounteidruckungswert im Bereich zwischen 5 und 15, 
insbesondere um etwa 10, liegt und dass der statische hohe Echounterdrudcungswert 
5 etwa im Beteicli vcm 1 bis 2, insbesondere etwa im Bereich von 1,5, liegt. 

1 1 . Ver&hren zur Reduktion von Echo bei der Obertragung von Audiosignalen, 
insbesondere gesprochener Sprache, mit den Schiitten: 

- Echounterdriickung zur Unterdruckung eines in einem Ausgangs-Audiosignal (A2) 
10 enthaltenen Echosignals (Al) eines Eingangs-Audiosignals (Al), 

- Detektion eines in dem Eingangs-Audiosignal (Al) enthaltenen Spiachsignals, und 

- EinsteUung eines Echounterdruckungsfektors (s) fur die Unterdruckung von Echo, 
dadurch peket«n»Myliriwf , 

dass der Echounterdruckungs&ktor (s) von einem wShrend des Vorliegens eines 
15 Sprachsignals in dem Eingangs-Audiosignal (Al) eingestellten hohen 

Echounterdruckungsw^ schiittweise und kontinuierlich auf einen niedrigen 
Echounlerdruckungswert reduziert wird, wenn detektiert wird, dass das Eingangs- 
Audiosignal (Al) kein Spiachsignal enthalt 

20 12. Computerprogramm mit Computerprogrammmittehi zur Veranlassung eines 

Computers zur Ausfuhrung der Verfehrensschritte des Verfehrens nach Ansprach 1 1, 
wenn das Ver&hren auf einem Computer ausgefuhrt wild. 
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Fig. 1 



PCX Application 

IB0306252 



